Python调用百度AI,实现音频转换文字(标准版)

本文介绍了如何使用Python配合百度AI服务将60秒以内的音频文件转换为文字。首先,文章提供了音频切割工具,如VAD和ffmpeg。接着,详细阐述了在Windows和Python3环境下创建百度AI应用并获取必要的认证参数。通过安装baidu-aip库,使用PCM格式的音频文件进行HTTP请求转换。此外,还提到了音频格式要求和可能出现的识别误差问题。
摘要由CSDN通过智能技术生成

写在前面:标准版最长支持60秒语音文件,大于60秒的音频文件,需要进行切割后,然后依次提交即可。

切割音频工具:
开源VAD音频切分工具

https://ai.baidu.com/ai-doc/SPEECH/xk38lxq46

ffmpeg模块

以下所有的操作均是在windows系统,Python3下实现的;

百度短语音识别介绍:https://ai.baidu.com/ai-doc/SPEECH/Vk38lxily

登录百度AI平台,建立创建应用:

URL=https://console.bce.baidu.com/ai/?fromai=1#/ai/speech/app/list

切记,接口选择:语音技术,建议全部勾选,一般默认是全部勾选的,按照页面的要求填写,即可

应用建立成功之后一定要记录以下几个参数的值,APP_ID

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值